模型设定
结合 Linear CEF Model 和 Linear Projection Model 的技术性条件得到 Linear Regression Model
(1) { Y = X T β + e E ( e ∣ X ) = 0 You can't use 'macro parameter character #' in math mode \begin{cases} E(Y^2)<\infty \\ E(\|X\| { #2 } )<\infty \\ E(XX^{\mathsf{T}}) \text{ is positive definite.} \end{cases} \tag{2} \begin{cases} E(Y^2)<\infty \\ E(\|X\| { #2 } )<\infty \\ E(XX^{\mathsf{T}}) \text{ is positive definite.} \end{cases} \tag{2} 求解参数
详见 Linear Projection Model#求解参数
此时
β p = E ( X X T ) − 1 E ( X Y ) = E ( X X T ) − 1 E [ X ( X T β + e ) ] = β + E ( X X T ) − 1 E [ X e ] 根据 Linear CEF Model#CEF Error 可知
E [ X e ] = 0 ⟹ β p = β 换言之,如果 E [ X e ] = 0 不成立,β p 就和 β 不一致。
内生性问题
若 E [ X e ] ≠ 0 ,则称线性回归模型存在内生性问题。
E [ e | X ] = 0 是比 E [ X e ] = 0 更强的假设,详见间奏:独立、均值独立与不相关 ,也就是说不需要违背均值独立,只需要违背线性不相关就会出现内生性问题。
使用存在内生性问题的线性回归模型本质上就是在使用线性投影模型,而线性投影模型本质上只提供 estimand 不保证 identification 准确。此外,线性回归模型还具有超越线性投影模型的优良性质(BLUE),因此有必要抢救一下。
使用工具变量法修复内生性问题,就是将线性投影模型修复为线性回归模型。
Best Linear Predictor
详见 Linear Projection Model#Best Linear Predictor